طراحی و پیاده سازی الگوریتم تطابق اسامی در زبان فارسی به منظور تشخیص رینفع واحذ

Σχετικά έγγραφα
ر ک ش ل ن س ح ن د م ح م ب ن ی ز ن. ل و ئ س م ه د ن س ی و ن ( ی ر ک ش ل &

ی ن ل ض ا ف ب ی ر غ ن ق و ش ه ی ض ر م ی ) ل و ئ س م ه د ن س ی و ن ( ا ی ن ل ض ا ف ب ی ر غ 1-

ی ا ک ل ا ه م ی ل ح ر

ا ت س ا ر د ر ا ب غ و د ر گ ه د ی د پ ع و ق و د ن و ر ی ی ا ض ف ل ی ل ح ت ی ه ا ب ل و ت ب ن

ج ن: روحا خل ل ب وج یم ع س ن

ن ا ر ا ن چ 1 ا ی ر و ا د ی ل ع د م ح م ر ی ا ف و ی د ه م ی

و ر ک ش ر د را ن ندز ما ن تا ا س ی یا را

ی ن ا م ز ا س ی ر ت ر ا ت ی و ه ر ی ظ ن ( ن ا ر ظ ن ب ح ا ص و

ا و ن ع ه ب ن آ ز ا ه ک ت س ا ی ی ا ه ی ن و گ ر گ د ه ب ط و ب ر م ر ص ا ح م ی م ل ع ث ح ا ب م ی ا ه ه ی ا م ن و ر د ز ا ی ک ی ی

ر گ ش د ر گ ت ع ن ص ة ع س و ت ر ب ن آ ش ق ن و ی ی ا ت س و ر ش ز ر ا ا ب ت ف ا ب ی ز ا س ه ب )

پژ م ی عل ام ه ص لن ف

ت خ ی م آ ر ص ا ن ع ز ا ن ا گ د ن ن ک د ی د ز ا ب ی د ن م ت ی ا ض ر ی س ر ر ب د

ه ش ر ا د ی ا پ ت ال ح م د ر ک ی و ر ر ب د ی ک ا ت ا ب ی ر ه ش ت ال ح م ی ر ا د ی ا پ ش ج ن س )

ک ک ش و ک ن ا ی ن ا م ح ر ی د ه م ن


. ) Hankins,K:Power,2009(

Website:

2

د ا ر م د و م ح م ر ی ا ر ی ح ب د ی م ح ن ن ا م ر ه ق ا ر ا س د


ر ه ش ت ی ر ی د م ه ب ن ا د ن و ر ه ش د ا م ت ع ا ن ا ز ی م ی ب ا ی ز ر ا )

2 - Robbins 3 - Al Arkoubi 4 - fry

Website:

ت ي ق ال خ خ ر م ي ن ي ت ي ص خ ش خ ر م ي ن ي ش و ه خ ر م ي ن : ی د ی ل ک ی ا ه ه ژ ا و ن. managers skills (Tehran Sama University)

ر ه ش ت ی ر ی د م ه ز و ح ر د ی ر و آ و ن ی ل م م ا ظ ن ی ب ا ی ز ر ا ب س ا ن م ل د م ه ئ ا ر ا و ن ا ر ه ت ر ه ش ن ال ک ر د ی

ر ا د م ن ا ر ی د م ب ا خ ت ن ا د ن ی آ ر ف و د ا د ع ت س ا ت ی ر ی د م ه ط ب ا ر ی س ر ر ب ز ر ب ل ا ن ا ت س ا ن ا ش و ه ز ی ت 2

ل ی ل خ د و و ا د ه ا ر ج ا ه م ز ا ن ه ب 3 د ن ک م ی ل س ی ف ر ش ا د ی ش ر ف : ه د ی ک چ.


ش ز و م آ ت ی ر ی د م د ش ر ا س ا ن ش ر ا ک. 4

1 2 Marsick & Watkins 3. Saw, Wilday & Harte 4 -Chen & Kuo 5. Liao,Chang & Wu 6 -Garvin


Website:

ا ر ب د. ر ا د د و ج و ط ا ب ت ر ا ی گ د ن ز ر س ن ا ز ی م و ی د ب ل ا ک و ش

م ش د ی ج م ن گ ر ب ه م ط ا ف ن ) ل و ئ س م ه د ن س ی و ن ( ی گ ر ز ب


ر ی د م ی د ه م ن ر ی د م ن ا س ح ا ن

ا د ی بن ت و ی ولا ی ذ ار گ د ف ه ما ن ت

ATLAS green. AfWA /AAE

Components and Job Stress

: ک ی ن و ر ت ک ل ا ت س پ

ا ر ه ت ت ا ق ی ق ح ت و م و ل ع د ح ا و ی م ال س ا د ا ز آ ه ا گ ش ن ا د زنان مطالعات د ش ر ا ی س ا ن ش ر ا ک ی و ج ش ن ا د

نگرشهاي دانشيار چكيده سطح آبه يا گرفت. نتايج

ت س ا ه د ش ن.

د ن د و ب ط س و ت م. ن ا ی گ ن ه ر ف ه ا گ ش ن ا د ن ا ن ک ر ا ک ی ن ا م ز ا س گ ن ه ر ف : ا ه ه ژ ا و د ی ل ک


د ی ن ا م ز ا س ی د ن و ر ه ش ر ا ت ف ر و ی ر ا ک ی گ د ن ز ت ی ف ی ک ل م ا و ع ن ا ی م و


Keywords: TRIZ, Creative Thinking, Scientific Thinking, Problem Solving, Innovation

ا س ا ر ب س ر ا د م ن ا ر ی د م ی ش خ ب ر ث ا ی ن ی ب ش ی پ ن ی ئ و ک و ن و ر م ا ک ی گ ت س ی ا ش ی و گ ل ا 2

ا ه د ا ف ت س ا ا ب ی ت ع ن ص ک ر ه ش ی ر ب ر ا ک ر ا ر ق ت س ا ر و ظ ن م ه ب ن ی م ز ر س ن ا و ت ی ب ا ی ز ر ا )

ی ا ر د د ر ا د ی گ ت س ب ی د د ع ت م ی ن و ر ی ب و ی ن و ر د ل م ا و ع ه ب ن ا ن ز ن د ش د ن م ن ا و ت د ن ت س ی ن ی ت ل ع ک ت ی ع ا م ت ج ا م

Website:

ن ا ب ر ق د ا و ج د م ح م ن

Journal of Sociological researches, 2015 (Autumn), Vol.9, No. 3


ا ب ی م ا ر گ ن ا گ ت خ ی ه ر ف ر ب

ا ه د ا ف ت س ا ا ب س ا ب ع ر د ن ب ر ه ش ی ر ب ر ف ا س م ه ن ا ی ا پ ی ا ر ب ب س ا ن م ن ا ک م ن ی ی ع ت GIS

ش ز و م آ ت ي ر ي د م و ی ر ب ه ر ه م ا ن ل ص ف ر ن ا ز ر ف د م ح م 3

An Investigation into Personal and Organizational Factors Affecting the Creativity of the National Iranian Gas Company Employees

1. Dwyer et al., 2. Beugre et al.,

Mohammad Kafi Zare Dr.Kambiz Kamkary Dr.Farideh Ganjoe Dr.Shohreh Shokrzadeh Shahram Gholami

Comparison of the components of religious attitudes among students of Guilan University

Relationship between Job Stress, Organizational Commitment and Mental Health

Journal of Sociological researches, 2015 (Autumn), Vol.9, No. 3

Website:

ن ا ه ف ص ا ه ا گ ش ن ا د ی س ا ن ش ن ا و ر و ی ت ی ب ر ت م و ل ع ه د ک ش ن ا د ی ت ی ب ر ت م و ل ع ه و ر گ ر ا ی د ا ت س ا

ل و ئ س م ه د ن س ی و ن ( ن ا ر ی ا ر ا س م ر گ ی م ال س ا د ا ز آ ه ا گ ش ن ا د ر ا س م ر گ د ح ا و ی ش ز و م آ ت ی ر ی د م ه و

سی سز ا اي ت ر ض و ا ی ح

Gholami, S. Ph.D student of Educational Psychology, University of Tabriz, Iran

س ی ن ب ز ا ن ی ر پ ه

ق ل ر ا ق د ا ج س 2 م ی ر ک ر و پ د ی س 3

ن ه ع ال م ط ا بی ان ز م

ش ز و م آ ت ي ر ي د م و ی ر ب ه ر ه م ا ن ل ص ف ر غ ا ر م ن ا ت س ر ه ش ه ط س و ت م س ر ا د م 3

ن ا ت س ب ا ت م و س ه ر ا م ش م ه ن ل ا س ای ن ا د م ه ر و پ ل ی ع ا م س ا ر ح س ن

Liquefied Natural Gas

نگرشهاي كارشناس چكيده توسعهي نشان ميدهد

Website:

د ا ز ع ی ف ش د ی م ح 1

2- Moorman 3 -Cohen et.al 4- Distributional justice 5- Procedural justice 6- Interpersonal justice

د ا ب آ م ل س ی ب ت ج م ی ی ا ض ر ه ی ض ا ر ه

ن ا ر ه ت ه ا گ ش ن ا د ر ا ی ش ن ا د - 3.

Employees in Oil Refinery Company

amongst the Faculty Members

Job Involvement of Women Teachers

BINOMIAL & BLCK - SHOLDES

مقدمه در تحلیل پاسخ فزکاوس ی بز خالف گزفته میضىد. است. حالت بسیار مهم حالت 0=σ s=σ+jω. هز قطب در صفحه s بصىرت : )جایگزینی s با (jω است.

ی م و ر ا ن ا ت س ر ه ش ه ط س و ت م ع ط ق م 1

خ شی ای ار ک ی اب زیرا ) را ن ت ه ر ش

)EXCEL( مرکس تحلیل آمار خ ارزمی *** مرکس آماری خ ارزمی

ا ر ف ی و ن ع م ی ر ب ه ر ل د م س ا س ا ر ب 2

د ش ک ا ر د ا ی ن ا م ز ا س ت ل ا د ع و ی و ن ع م ی ر ب ه ر ن ی ب ه ط ب ا ر ی

Investigation of the Womens' Position in Participatory Decision-making from the Perspective of Managers in Public Organizations of Isfahan Province

Predicting the dimensions of domestic violence based on coping strategies and psychological wellbeing among married female students

آ ی ط ه ک ه د و ب ی ش ی ا م ی پ ع و ن ز ا ر ض ا ح ش ه و ژ پ ش و ر. د و ب د ز ی ر ه ش ی ع ا ف ت ن ا ر ی غ و ی ت ل و د ه ط س و ت م ع ط ق م ی

ر ا ف ن ا ت س ا ی م ال س ا د ا ز آ ه ا گ ش ن ا د ی م ل ع ت أ ی ه ی ا ض ع ا ی ل غ ش 3

2. Knowledge Management

ه ش م ر ه ش ه ط س و ت م م و د ع ط ق م ن ز ن ا م ل ع م 2

: ک ی ن و ر ت ک ل ا ت س پ

Predict amount of self-efficacy based on components of cognitive emotion regulation among students in Kurdistan University


Transcript:

طراحی و پیاده سازی الگوریتم تطابق اسامی در زبان فارسی به منظور تشخیص رینفع واحذ لیال مومنی نسب momeninasab.leila@gmail.com دکتر نیما امیرشکاری nima.itpro@gmail.com استاد جالل ملکی jalal.maleki@liu.se پرفسور الرش اهرنبرگ lars.ahrenberg@liu.se سومین همایش ساالنه بانکداری الکترونیک و نظام های پرداخت conf.mbri.ac.ir/ebps3 کاربرد هروری بر الگوریتن های هوجود یک الگوریتن تطابق اساهی برای زبان فارسی پی دا ارزیابی نتیجه آینده کاری 2

کاربرد دس صهی ۀ تا کذاسی هالی تشای تشخیض تملة هذیشیت استثاط تا هشتشی ضذ پ لش یی ستث ت ذی اعتثاسی تشخیض ری فع احذ 3 هروری بر الگوریتن های هوجود تغییشات اساهی الگ سیتن ای تطاتك اساهی صتاى فاسسی 4

هروری بر الگوریتن های هوجود تغییرات اساهی دس اساهی یکساى اتفاق هی افتذ تغییشات شتاسی خطا ای اهالئی شتاس جایگضیي یس گشدا ی حش ف تی طذا تغییشات فیلذ اساهی ن اسص 5 هروری بر الگوریتن های هوجود تغییرات اساهی هختظش یسی لطع شذى تشجو اضاف یا حزف اجضاء استفاد اص عالئن 6

هروری بر الگوریتن های هوجود الگوریتن های تطابق اساهی آیا ایي د اسن ت یک شخض احذ تعلك داسد Mohamedamin و Mohamed Amin الگ سیتن ای تطاتك ط تی Soundex الگ سیتن ای تفا ت سشت ای Levenshtein الگ سیتن ای تش هث ای ت کي Q-gram 7 هروری بر الگوریتن های هوجود زبان فارسی الفثای صتاى فاسسی 33 حشف سیستن شتاسی Perso-Arbic اص چپ ت ساست اتظال حش ف دس شتاس 8

هروری بر الگوریتن های هوجود یک الگوریتن تطابق اساهی برای زبان فارسی Levenshtein Arabic Edit Distance Algorithm (AEDA) PEDA 9 پی دا ایي د اسن فاسسی چ ا ذاص تا ن شثا ت داس ذ ه سار هشاد 10

ع) غ) ج) ب) ئ) م) أ) ر) ا) أ) أ) ط) ک) آ) ا) ت) ک) ب) ج) ش) ج) ی) پ) ز) ر) د) ح) ص) ف) ت) پ) ث) ب) چ) پ) پ) پ) ب) ت) ت) ن) ن) ث) ث) ئ) پی دا سط ح شثا ت دس صتاى فاسسی شثا ت فشهی شثا ت ط تی شثا ت کی ت سدی ستۀ اطلی کذ پی دا 11 پی دا سطوح شباهت در زبان فارسی شباهت فرهی ی( ؤ) Form Similarity in Persian Alphabet(between origin letter forms) No. Similar Groups Similarity Index 1. - ك ) - إ( - إ( - آ( - إ( - آ( - ا( - ي ( (ه - ۀ ) )ة - ۀ ) )ة - ه ( 1 2. - ظ( - ض( - ز( - ذ( - خ( - ح( ث( - ) 0.8 ب) ب) چ) ك) - ئ( - گ( - غ( 3. - ق ) - ن( - ي( - ی( - ي( - ی( 0.54 4. - ژ ) - چ( - پ( 0.6 5. - ن ) - ژ( - ش( - ح( 0.4 6. - ف ) 0.27 7. - ث( - ت( - ث( - ت( - ل( 0.2 8. - ی( - ي( - ی( - ي( - ی( - ي( - خ( - ن( - خ( - ن( 0.14 - ث ) - ن ) ئ) - ت ) 9. - ه ) 0.07 10. Any other pair of Persian letters 0 12

ا) أ) أ) أ) ی) ک) ؤ) ث) ز( ح) ب) ؤ) ئ) ت) ج) م) ك) ة) پی دا سطوح شباهت در زبان فارسی شباهت صوتی Phonetic Similarity in Persian Alphabet(between origin letter forms) No. Similar Groups Similarity Index - ك( - ي( - ا( - ع( - ئ( - آ( - ) )ت - ط( 1 - ش - ص( -ذ-ض-ظ) - ه( )ح - ة( )ع - ا( )غ - ق( - ه( - د( - ع( )ة - ی ) 0.8 0.6 - پ( 0.4 )ث ش ص - ز ذ ض ظ( ژ) ف) ک) - ن( - گ( - چ( - ش( - ) - گ( 0.2 - ت ) 0.1 Any other combination of Persian letters 0 13 پی دا سطوح شباهت در زبان فارسی شباهت کی بوردی Sim kb a, b = 1 x a x b 2 + y a y b 2 ψ 14

پی دا هستۀ اصلی کد پی دا Levenshtein تثذیل اسن هثذا ت اسن همظذ تا کوتشیي ضی حذالل تعذاد عولیات تشای تثذیل جایگضی ی حزف اضاف 15 پی دا هستۀ اصلی کد پی دا Levenshtein یک هاتشیکس هی ساصد سطش ا ل ست ى ا ل هاتشیکس سا پش هی ک ذ 16

پی دا هستۀ اصلی کد پی دا Levenshtein سل ل ای هاتشیکس سا تا ت ج ت همادیش وسای ا پش هی ک ذ 17 پی دا هستۀ اصلی کد پی دا ضی ۀ عولیات حزف اضاف ضی ۀ عول جایگضی ی 18

پی دا هستۀ اصلی کد پی دا هثال ه سار هشاد = 88% 19 ارزیابی ا جام س سشی اص آصهایشات تایج تطاتك 20

ارزیابی انجام سه سری از آزهایشات ا لیي سشی Modified 1,000,000 records 1000 First Names Divided to 10 data sets of 100 records 1000 First Names A result data set includes 100,000 matches 21 ارزیابی انجام سه سری از آزهایشات سشی د م 1,000,000 records Divided to 10 data sets of 10 records Decoupled into 2 data sets of 100 records A result data set includes 1000 matches 22

ارزیابی انجام سه سری از آزهایشات پی دا تشای تعذاد هختلفی اص عولیات چگ عول هی ک ذ 100 matches which differ in just 1 edit 1,000,000 records 100 matches which differ in just 2 edits 100 matches which differ in just 3 edits 100 matches which differ in just 4 edits 23 ارزیابی نتایج تطابق ا لیي سشی PEDA Precision Recall f-measure DS01 0.8 0.9 0.85 DS02 0.77 0.95 0.85 DS03 0.89 0.95 0.92 DS04 0.81 0.97 0.88 DS05 0.73 0.96 0.83 DS06 0.79 0.95 0.86 DS07 0.79 0.99 0.88 DS08 0.79 0.96 0.87 DS09 0.75 0.95 0.84 DS10 0.7 0.95 0.81 f-measure mean 0.86 24

ارزیابی نتایج تطابق ا لیي سشی: همایس تا ل شتیي Levenshtein DS0 DS0 DS0 DS0 DS0 DS0 DS0 DS0 DS0 DS1 1 2 3 4 5 6 7 8 9 0 True positives 95% 100% 94% 99% 99% 96% 97% 96% 97% 98% False positives 5% 0% 6% 1% 1% 4% 3% 4% 3% 2% True 59% 65% 65% 74% 67% 65% 69% 68% 62% 67% negatives False negatives 41% 35% 35% 26% 33% 35% 31% 32% 38% 33% PEDA DS0 DS0 DS0 DS0 DS0 DS0 DS0 DS0 DS0 DS1 1 2 3 4 5 6 7 8 9 0 True positives 86% 78% 90% 81% 73% 79% 79% 21% 76% 70% False positives 14% 22% 10% 19% 27% 21% 21% 79% 24% 30% True 92% 91% 91% 96% 93% 92% 98% 94% 96% 93% negatives False negatives 8% 9% 9% 4% 7% 8% 2% 6% 4% 7% 25 ارزیابی نتایج تطابق د هیي سشی Precision Recall f-measure DS01 1 1 1 DS02 0.64 0.78 0.7 DS03 0.83 0.55 0.66 DS04 0.75 0.43 0.55 DS05 0.71 0.83 0.76 DS06 0.86 1 0.92 DS07 1 1 1 DS08 1 0.75 0.86 DS09 1 0.71 0.83 DS10 0.71 0.83 0.76 f-measure mean 0.80 26

ارزیابی نتایج تطابق س هیي سشی 1 edit 2 edits 3 edits 4 + edits True positives 99% 81% 69% 42% False positives 1% 19% 31% 58% 27 ارزیابی ا اع تغییشات اساهی سا دس داد ای تست آ سد این تایج سا تشای ا اع تغییشات اساهی تشسسی و دین s t Similarity ح ح پري پري 45% زري زىرا 68% سيد احمد احمد 70% نسيب آقا نسية 69% اقا شهساد شيساد 64% محجوبه مجح پو 76% زينب نه نه خانم زينة ن ن خا 68% فاطمه فاطي 64% 28

نتیجه پی دا تشای تغییشات شتاسی لطع شذى خ ب عول هی ک ذ ت طی هی ش د دس ک اس الگ سیتن ای دیگش استفاد ش د 29 آینده کاری ت سعۀ ل ا یي شثا ت شو ذ ساصی پی دا تشکیة تا پایگا داد ای ه اسد خاص )ها ذ اساهی اشخاص ششکت ا ام اه...( 30

با تشکر سومین همایش ساالنه بانکداری الکترونیک و نظام های پرداخت 16 و 17 دی ماه 1392 مرکز همایش های برج میالد conf.mbri.ac.ir/ebps3